home *** CD-ROM | disk | FTP | other *** search
/ Power Tools 1993 November - Disc 1 / Power Tools Plus (Disc 1 of 2)(November 1993)(HP).iso / sys / csover / csover07.txt < prev    next >
Text File  |  1992-05-01  |  15KB  |  320 lines

  1. Unit 7 High Availability Solutions
  2.    Purpose
  3. This unit describes how HP's high-availability solutions can assist the
  4. high-end customer in maximizing data and system availability.
  5.  
  6. Objectives
  7. At the end of this unit, you will be able to:
  8. o Explain why high availability is particularly important to high-end
  9.   customers.
  10. o List the major high-availability solutions available from HP.
  11. o Describe why HP high-availability solutions are superior to
  12.   competitive solutions.
  13. o Describe key points in HP's vision for the future of high
  14.   availability.
  15.  
  16. Introduction
  17. High availability is a critical aspect of systems management that
  18. ensures the consistent and dependable availability of both data and
  19. systems. High availability means that access to mission-critical data
  20. and applications is maximized by:
  21. o Minimizing unplanned down-time
  22. o Minimizing or eliminating planned down-time
  23. High-availability solutions protect a business's ability to function.
  24. This is particularly true with high-end customers because:
  25. o Minutes or hours of down-time may mean thousands of dollars in lost
  26.   productivity, lost revenue, and increased expenses.
  27. o High-end configurations are larger, so the impact of unavailable data
  28.   and resources affects a larger community of users.
  29. o The significant investment in hardware warrants a highly available
  30.   environment.
  31. o Operations may be round-the-clock, and any unavailability has a
  32.   significant effect.
  33.    In high-end environments, system down-time cannot be tolerated.
  34.  
  35. HP Solutions
  36.    HP Strategy
  37. HP offers a range of products that provide increasing levels of high
  38. availability, enabling customers to tailor the best solutions for their
  39. environments. The focus is on minimizing both planned and/or unplanned
  40. down-time.
  41.  
  42. [Figure: High Availability in the Data Center, caption: none]
  43.  
  44. Key Messages
  45. HP continues to provide industry-leading hardware reliability with PA-
  46. RISC and VLSI technologies. Today, HP's Corporate Business Systems build
  47. on this foundation by providing built-in high-availability features in
  48. the hardware.
  49.    HP's software is reliable and is subjected to rigorous quality
  50. testing. In addition, MPE/iX provides a comprehensive software
  51. resiliency strategy that anticipates software failures before they occur
  52. and takes action to further improve system up-time.
  53.    In addition to high reliability, HP offers solutions to further
  54. enhance data integrity and availability, system availability, and fault
  55. and disaster tolerance. HP also has solutions to address the various
  56. causes of unplanned failures.
  57.  
  58. [Figure: Causes of Unplanned Failures, caption: none]
  59.  
  60. Highly Reliable Hardware and Software
  61.    Reliable Hardware
  62. For the HP 3000 and HP 9000
  63.    The HP 3000 and HP 9000 Corporate Business Systems incorporate high-
  64. availability features in their error correcting circuitry, memory
  65. arrays, I/O channels, and main processor memory bus. Easy
  66. deconfiguration of failed CPUs, memory, or I/O interface modules enable
  67. Corporate Business Systems to achieve a maximum hardware up-time 99.97%.
  68. Also included are standard features such as automatic system recovery
  69. with powerfail (battery backup).
  70.  
  71. Reliable Software
  72. Both the MPE/iX and HP-UX operating systems have been designed to offer
  73. a superior level of software reliability.
  74.  
  75. System Boot-Up
  76. During the system boot-up process, if an error occurs while mounting
  77. user volumes, MPE/iX and HP-UX will identify the problem volumes and
  78. continue to mount the others. The systems also provide auto
  79. configuration at system startup.
  80.    For the HP 3000
  81. MPE/iX is solid even under heavy loading and is a bullet-proof operating
  82. environment.
  83.  
  84. Try/Recover Routines
  85. For example, MPE/iX Release 4.0 has been protected in 24 additional ways
  86. from system failures. In addition, try/recover routines, which have
  87. always existed in MPE/iX, have been implemented in even more places for
  88. even higher resiliency. Try/Recover routines enable MPE/iX to recover
  89. from error conditions without failing the system. This ongoing
  90. commitment to software excellence makes MPE/iX the most robust
  91. commercial operating system in the industry, next to MVS/ESA.
  92.  
  93. Table Monitor
  94. Another bullet-proof capability comes with the use of a Table Monitor.
  95. This feature, available in Q4CY92, monitors table usage and proactively
  96. responds to prevent tables from being exceeded. This feature, combined
  97. with new larger table sizes, will contribute to making the HP 3000 even
  98. more available to users on a daily basis.
  99.  
  100. Aggregate Parallel Recovery
  101. MPE/iX Release 4.0 incorporates a new feature called Aggregate Parallel
  102. Recovery (APR). This enables system and user volumes to be recovered in
  103. parallel rather than serially. This speeds up the system bootup process,
  104. increasing system up-time.
  105.    For the HP 9000
  106. HP-UX is the most mature commercial UN*X operating environment in the
  107. industry. Extensive testing is done on all major releases to ensure
  108. reliability and resiliency.
  109.  
  110. Data Integrity and Availability
  111. Both the HP 3000 and HP 9000 offer a variety of Data Integrity
  112. solutions.
  113.  
  114. For the HP 3000 and HP 9000
  115.    RAID
  116. The use of Redundant Arrays of Inexpensive Disks (RAID), or parity disk
  117. arrays, provide added measures of data availability and recovery in the
  118. event of a disk failure. The use of disk arrays is very common in high-
  119. end environments.
  120.  
  121. [Figure: High Data Availability, caption: none]
  122.  
  123. Disk Mirroring
  124. Software disk mirroring further increases the availability of disks
  125. beyond disk arrays. A disk array will not remain available if the array
  126. controller, interface card, or power supply fails. With mirroring, data
  127. is also available from another array with a functioning controller,
  128. interface card, or power supply.
  129.  
  130. SCSI Mirroring
  131. Mirroring of SCSI disk drives is supported on MPE/iX 4.0 and HP-UX 9.0.
  132.    For the HP 3000
  133. MPE/iX Transaction Manager
  134.    MPE/iX features an integrated built-in transaction manager which
  135. automatically and transparently provides data integrity for databases,
  136. indexed (keyed) sequential access method (KSAM) files, system and file
  137. system directories, and other critical system tables.
  138.    In the event of a system failure or extended power outage, the
  139. contents of memory, databases, files, and critical system tables are
  140. automatically and transparently restored to a state of data integrity by
  141. the transaction monitor.
  142.  
  143. NetBase Shadow
  144. Disk mirroring and disk sharing across a network are now available with
  145. the NetBase Shadow feature, enhancing data availability on the HP 3000.
  146. This feature differs from Mirrored Disk/iX in that it can mirror to more
  147. than 12 sites, and across a WAN. Any mirrored set of disks can be used
  148. for on-line backup purposes.
  149.  
  150. For the HP 9000
  151.    Logical Volume Manager
  152. Because of HP's strong commitment to standards, OSF's Logical Volume
  153. Manager (LVM) is supported on HP-UX. LVM mirroring maintains up to three
  154. copies of data on separate disks. Disks in a mirrored pair or triplet
  155. can be taken off-line for backup while applications continue to access
  156. data on-line. LVM also provides the capability for files (maximum 2
  157. Gbytes) to span multiple physical volumes, improving performance and
  158. availability.
  159.  
  160. System Availability
  161.    For the HP 3000 and HP 9000
  162. SwitchOver
  163.    Response to a failure at the system level should be automatic,
  164. quickly returning operations back to normal. HP's solutions, such as SPU
  165. SwitchOver/iX for MPE/iX and SwitchOver/UX for HP-UX, provide near-
  166. continuous operation of mission-critical computing environments.
  167. SwitchOver/UX provides for automatic fault detection and recovery of the
  168. failed SPU.
  169.  
  170. HP Support Watch HP Predictive Support
  171. HP also provides services to minimize unplanned system down-time. HP
  172. Support Watch for HP-UX and HP Predictive Support for MPE/iX monitor the
  173. system to proactively detect and report hardware faults to the Response
  174. Center and system operator before they cause a failure.
  175.  
  176. For the HP 3000
  177.    AutoRestart/iX
  178. With MPE/iX release 4.0, AutoRestart/iX (included with HP 3000 CS DX)
  179. has been enhanced. Compression is available to reduce the amount of disk
  180. space needed for a dump, and the need to dedicate an entire disk for
  181. dumps has been eliminated. In  addition, a toggle has been added to
  182. enable customers to turn the autoboot feature in AutoRestart/iX on or
  183. off.
  184.  
  185. Disaster Tolerance
  186. Natural disasters that interrupt the availability of systems and data
  187. can ruin an entire business. High-end data center managers are under
  188. pressure to have disaster recovery plans.
  189.  
  190. For the HP 3000
  191.    NetBase
  192. NetBase for MPE/iX offers wide-area disaster recovery. By automatically
  193. maintaining copies of data throughout a geographically dispersed
  194. network, NetBase Shadowing ensures the availability of the data in the
  195. event of a natural disaster. If a system on the network should go down,
  196. one command can redirect file access to an alternate computer, bringing
  197. an unavailable application back on-line in a very short period of time.
  198. For the HP 3000 and HP 9000
  199.  
  200. Disaster Recovery
  201. HP also offers Disaster Recovery Services to allow customers to plan for
  202. a natural disaster. In the event of a disaster, the HP Backup service
  203. provides around-the-clock access to fully operational configurations.
  204.  
  205. [Figure: US map, caption: none]
  206.  
  207. Competition
  208.    Reliable Hardware and Software
  209. Although IBM, competing againstIBM's 3090/ES9000 is perceived to be
  210. extremely reliable, HP's systems provide higher availability due to a
  211. simpler design with fewer parts (the HP 3000 has won DataPro's
  212. reliability rating for years). Water cooling on IBM's 3090, for example,
  213. introduces additional points of failure. Since HP systems are air-
  214. cooled, these points of failure do not exist.
  215.    MVS/ESA, as software, provides a high degree of fault resilience to
  216. system failure. In the event of a near-fatal fault, software errors are
  217. trapped via Functional Recovery Routines and are worked around
  218. dynamically.
  219.    MVS/ESA offers more granularity in the way it shuts down, but
  220. applications must be specifically coded to take advantage of it. For
  221. example, IBM recommends dedicating one database per application. If the
  222. database fails, only that one application is unavailable. However, it
  223. creates additional programming work and overhead to enable the databases
  224. to interact.
  225.    MPE/iX Release 4.0 incorporates many new software resiliency features
  226. to enhance system up-time. It is the most reliable commercial operating
  227. system next to MVS/ESA. HP-UX is the most mature and reliable UNIX
  228. operating environment in the industry.
  229.  
  230. Data Integrity and Availability
  231. Both HP's MPE/iX and IBM's MVS/ESA provide a high degree of data
  232. integrity through facilities such as transaction logging. Transaction
  233. logging allows for data to be recovered from a log file in the event of
  234. a "soft" failure (using rollback recovery), or a "hard" failure (using
  235. rollforward recovery).
  236.    MPE/iX has a key advantage in that it provides this functionality as
  237. an integral part of the operating system. Complete transaction
  238. management occurs with all applications transparently. MVS/ESA provides
  239. this functionality however, it is only implemented via its various OLTP
  240. teleprocessing (TP) monitors, CICS, or IMS/DC. OLTP applications are
  241. dependent on these additional subsystems for transaction logging. While
  242. virtually all MVS/ESA environments utilize these subsystems, having to
  243. do so adds to the complexity (and cost) of the system they must manage.
  244. MPE/iX provides the most complete, transparent, inherent transaction
  245. manager for consistent data integrity.
  246.    MPE/iX is the most robust commercial operating system in the industry
  247. next to MVS.
  248.    HP and IBM are on a parity level with regard to their disk mirroring
  249. and disk array functionality. (In fact, Storage Tek uses HP's disk
  250. technology in its "Iceberg" intelligent storage subsystems. HP is
  251. investigating Iceberg support for a later date.)  MPE/iX has an
  252. advantage over IBM in being able to mirror disks across a WAN with
  253. NetBase.
  254.  
  255. System Availability
  256. IBM and HP are on a parity level with regard to SPU switchover
  257. functionality. HP is also on a parity level with DEC clusters. HP has an
  258. advantage over the AS/400 with regard to system availability for several
  259. reasons. The AS/400 has no transaction manager.  After a system failure,
  260. disks must be reloaded, otherwise the data is not recovered. This can
  261. take more than 8 hours! In addition, the AS/400 does not have a
  262. switchover product.
  263.  
  264. Disaster Tolerance
  265. The HP 3000 has an advantage over DEC, competing againstDEC and IBM with
  266. regard to wide-area disaster tolerance. IBM cannot mirror disks over a
  267. WAN, so a remote IBM system cannot take over for a failed primary SPU.
  268. DEC has the same problem. And DEC VAXclusters don't provide the WAN
  269. feature required for disaster recovery (because the cluster must reside
  270. at one location).
  271.  
  272. HP's Vision for the Future
  273. HP will incorporate new hardware and software design features to provide
  274. even greater availability in the future and further reduce the potential
  275. for system failure. These features also will help minimize or eliminate
  276. planned down-time for system maintenance.
  277.  
  278. [Figure: The Drive Towards Continuous Availability, caption: none]
  279.  
  280. Planned hardware enhancements include:
  281. o On-line replacement for critical elements, including datacomm links,
  282.   I/O buses, and I/O interfaces
  283. o On-line CPU and memory replacement for future HP multiprocessing
  284.   systems
  285. o Hardware resiliency features that prevent component failures from
  286.   causing a hard crash
  287. o "Memory de-allocation" to allow a memory board to detect correctable
  288.   errors that usually precede a failure and take itself off-line.
  289. o "Graceful degradation" to enable a processor board (in a multi-
  290.   processing system) to anticipate its own failure and take itself off-
  291.   line without bringing the system down
  292. Software enhancements will include "bullet-proofing" all MPE/iX
  293. subsystem applications to further enhance software resiliency. Software
  294. resiliency features are also planned for future releases of HP-UX to
  295. reduce the root cause of system panics.
  296.  
  297. Index
  298. Aggregate Parallel Recovery (APR)  7-5
  299. AutoRestart/iX  7-7
  300. DEC, competing against  7-9
  301. Disaster Recovery Services  7-8
  302. Disk mirroring  7-6
  303. IBM, competing against  7-8
  304. Logical Volume Manager  7-7
  305. MPE/iX  7-3, 7-5
  306. NetBase  7-8
  307. NetBase Shadow  7-7
  308. Predictive Support  7-7
  309. Redundant Arrays of Inexpensive Disks (RAID)  7-5
  310. SPU SwitchOver/iX  7-7
  311. Support Watch  7-7
  312. SwitchOver/UX  7-7
  313. Table Monitor  7-5
  314. Transaction manager  7-6
  315.  
  316. Associated files: U2-06.HPG, WBDB03.GAL, WBDB02.GAL, WBDB01.GAL,
  317. WBDB04.GAL, U2-06.HPG, WBDB03.HGL, WBDB02.HGL, WBDB01.HGL, WBDB04.HGL,
  318. 7.doc
  319. Unit 7 High Availability Solutions
  320.